[Python] Python 之 function, unbound method 和 bound method
首先看一下以下示例。(Python 2.7)
1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 4 class C(object): 5 def foo(self): 6 pass 7 8 c = C() 9 10 print 'C.foo id:', id(C.foo), type(C.foo) 11 print 'c.foo id:', id(c.foo), type(c.foo) 12 13 a = C.foo 14 b = c.foo 15 16 print 'a = C.foo id:', id(a), type(a) 17 print 'b = c.foo id:', id(b), type(b)
输出:
1 C.foo id: 2582008 <type 'instancemethod'> 2 c.foo id: 2582008 <type 'instancemethod'> 3 a = C.foo id: 2582008 <type 'instancemethod'> 4 b = c.foo id: 2485624 <type 'instancemethod'>
为什么第1到3行输出id相同,而第4行id则变了呢?
当你通过句号标记法查找一个对象的方法时,例如class.name或者instance.name,Python会自动为该对象创建一个新的method对象。Python使用描述器来将一个function对象封装为method对象。
因此,当你使用id()函数查找C.foo的id时,Python创建了一个新的method对象,当你读取了这个method对象的id(其实就是内存地址)后,这个method对象就被销毁了,因此它所占用的内存被释放出来。接着你用同样的方法查找c.foo的id,一个新的method对象在刚才被释放的内存中被创建并随之销毁,因为前后两个对象都是在同一个内存地址创建,因此你看到的id(内存地址)是一样的。为什么两个method对象都会在读取完id后被销毁呢?这与Python的垃圾回收机制有关,Python使用引用计数器来控制垃圾回收,当一个对象引用次数为0时就会被回收销毁,因此当id()函数执行完毕后,再没有任何其他对象引用这两个method对象,因此它们被销毁释放出内存。
接下来的第13、14行,你将待绑定方法(unbound method)C.foo的一个索引(或者称引用)保存到一个变量a中,因为此时刚刚新建的C.foo对象的索引计数器值为1,不是0,因此它没有被当作垃圾回收并销毁,因此也就不会释放它所占用的内存。随后你使用c.foo创建了第二个method对象,它被指派在另一个新的内存地址上,因此最后你看到的id(a)和id(b)的值是不一样的。
当你使用id()函数查看对象的id时,应该知道以下官方关于id()的描述:
Return the “identity” of an object. This is an integer (or long integer) which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same id() value.
CPython implementation detail: This is the address of the object in memory.
返回一个对象的唯一标识。该标识为一个整数(或者long类型整数),该整数保证了唯一性,并且伴随所标识的对象的整个生命周期。两个生命周期没有重叠的对象可能具有相同的id值。
CPython的实现细节:充当对象身份标识的整数是对象在内存中的地址。
你也可以使用类的__dict__属性通过索引直接指向目标函数,然后调用目标函数的__get__方法创建一个method对象。
1 Python 2.7.3 (default, Feb 27 2014, 21:38:55) 2 [GCC 4.6.3] on linux2 3 Type "help", "copyright", "credits" or "license" for more information. 4 >>> class C(object): 5 ... def foo(self): 6 ... pass 7 ... 8 >>> C.foo 9 <unbound method C.foo> 10 >>> C.__dict__['foo'] 11 <function foo at 0x2ec5b0> 12 >>> C.__dict__['foo'].__get__(None, C) 13 <unbound method C.foo> 14 >>> C.__dict__['foo'].__get__(C(), C) 15 <bound method C.foo of <__main__.C object at 0x2ef550>>
以上示例中,第4行创建了一个类C,第8行创建了一个待绑定方法对象(unbound method)C.foo,第10行引用了一个函数对象(function),第12行创建了一个待绑定方法对象C.foo,第14行创建了一个已绑定方法对象(bound method)。
其中第10行所引用的函数对象每次被调用都是引用同一个函数对象,而第8行、12行、14行每次调用都是新创建一个method对象。
function对象的__get__方法负责将函数封装为一个method对象,这个method对象可以是bound method或者unbound method。
1 >>> def b(x):print "Argument x is ", x 2 ... 3 >>> b.__get__ 4 <method-wrapper '__get__' of function object at 0x55d770> 5 >>> b.__get__(None, C) 6 <unbound method C.b> 7 >>> b.__get__(C, C)() 8 Argument x is <class '__main__.C'> 9 >>> b.__get__(None, C)() 10 Traceback (most recent call last): 11 File "<stdin>", line 1, in <module> 12 TypeError: unbound method b() must be called with C instance as first argument (got nothing instead)
函数b通过调用__get__方法可以将自己封装为一个method,如果使用一个class对象来调用函数的__get__方法,得到的就是unbound method,使用instance对象来调用函数的__get__方法,得到的就是bound method。函数的__get__方法所实行的封装过程,其实就是将函数绑定到一个对象上,无论是unbound method还是bound method,最终都是绑定到一个类或者实例上,因此这里所谓的unbound和bound其实是针对该方法是否是绑定到实例而言。
对于在类中定义的实例方法,例如上述示例中的class C中的foo方法,c.foo()等同于C.foo(c),不同的是前者的foo是bound method,后者foo是unbound method。
在Python 3K中,已经去除unbound method和bound method两个概念,取而代之的是,C.foo将得到一个函数对象,而c.foo将得到一个方法。新的定义更加合理清晰,不容易使陌生人感到困惑。
之所以做出这样的修正,是因为Python对方法的理解与大多数语言不同,Python 3K对方法的理解是:方法是一个预置了一个实例对象作为第一个参数的函数。预置一个实例对象使得函数变成了一个已绑定方法(bound method)。
而Python 2K对于方法的理解是:一个方法如果没有和一个实例进行绑定,那么它就是一个unbound method,一个unbound method对象可以视为一种函数,这种函数受到一种限制,就是必须将一个实例作为第一个参数传入。于是unbound method就是处于一种待命状态,一旦被绑定就成了一个bound method。
但是,随着时间的脚步,人们发现unbound method就是一个function,而对这个函数作出首个参数必须是正确的实例的限制意义不大,因此在Python 3中就去除了这个限制,使之更加符合鸭子理论。
了解更多《First-class Everything (Python缔造者Guido van Rossum关于bound/unbound method的来历叙述)》